参数估计(3)
Published:
区间估计
核心思想是找到两个统计量\(\theta_L\) 和\(\theta_U\) 把参数包住\(\theta_L \leq \theta \leq \theta_U \),目标是使得参数落在这个区间的概率尽可能地大。 \(P_\theta(\theta_L \leq \theta \leq \theta_U) \geq 1-\alpha\) 这里的区间就称为\(\theta\)的\(1-\alpha\)的置信区间,其中\(\theta_L\) 和\(\theta_U\)分别称为置信下限和置信上限。
如果对于任何参数空间中的参数不等式都成立则这个区间称为\(\theta\)的\(1-\alpha\)同等置信区间
枢轴量法(构造置信区间)
- 基于点估计,最大似然估计,矩估计等其中的一个方法对参数进行统计量估计,然后写出基于估计量的密度函数(一般带有\(\theta\)然后转化为不带\(\theta\)的)从而得到\(G(x_1,x_2,\cdot,x_n,\theta)\) 称为枢轴量\(G\)
- 然后有了他的分布函数就能得到CDF,进而得到\(P(c \leq G \leq d)\) 的表达式让他等于\(1-\alpha\)
- 得到c,d的约束条件,然后\(c\leq G \leq d \rightarrow \theta_L \leq \theta \leq \theta_U\)
- 接着求\(E_\theta(\theta_U -\theta_L)\) 的最小值从而确定c和d,从而确定置信区间
当很难做到这一点的时候,采用等尾置信区间 \(P_\theta(G <c)=P_\theta(G>d)=\alpha/2\)
大样本置信区间(样本量充分大,用渐进分布来构造近似的置信区间)
二点分布\(B(1,P\) )的置信区间 \([\bar{x}-u_{1-\alpha/2}\sqrt\frac{\bar{x}(1-\bar{x})}{n},\bar{x}+u_{1-\alpha/2}\sqrt\frac{\bar{x}(1-\bar{x})}{n}]\)
结论
正态分布的期望的$1-\alpha$置信区间(标准差已知) \([\bar{x}-u_{1-\alpha/2}\sigma/\sqrt{n},\bar{x}+u_{1-\alpha/2}\sigma/\sqrt{n}]\) 这里$u_{1-\alpha/2}$为标准正态分布的上$1−\alpha/2$分位数。
正态分布的期望的$1-\alpha$置信区间(标准差未知) \([\bar{x}-t_{1-\alpha/2}(n-1)s/\sqrt{n},\bar{x}+t_{1-\alpha/2}(n-1)s/\sqrt{n}]\) 这里$s$ 取用样本标准差(无偏估计),这里$t_{1-\alpha/2}(n-1)$为自由度为$n-1$ 的$t$ 分布的上$1−\alpha/2$分位数。
正态分布的方差的$1-\alpha$置信区间(期望未知) \([(n-1)s^2/\chi^2_{1-\alpha/2}(n-1),(n-1)s^2/\chi^2_{\alpha/2}(n-1)]\) 均匀分布$U(0,\theta)$的$1-\alpha$置信区间: \([x_{(n)},x_{(n)}/\sqrt [n]{\alpha}]\) $x_1,x_2,\dots,x_m$为来自$N(\mu_1,\sigma_1^2)$ 的样本,$y_1,y_2,\dots,y_n$ 为来自$N(\mu_2,\sigma_2^2)$ 的样本,且两个样本相互独立
$\mu1-\mu2$ 的置信区间:
1.方差均已知 \([\bar{x}-\bar{y}-u_{1-\alpha/2}\sqrt{\frac{\sigma_x^2}{m}+\frac{\sigma_y^2}{n}},\bar{x}-\bar{y}+u_{1-\alpha/2}\sqrt{\frac{\sigma_x^2}{m}+\frac{\sigma_y^2}{n}}]\) 2.两者方差相等但是未知 \([\bar{x}-\bar{y}±\sqrt{\frac{m+n}{mn}}s_{w}t_{1-\alpha/2}(m+n-2)]\) 其中 \(s_w^2=\frac{(m-1)s_x^2+(n-1)s_y^2}{m+n-2}\)
3.方差的比值已知$\sigma_2^2/\sigma_1^2=c$ \([\bar{x}-\bar{y}±\sqrt{\frac{c}{n}+\frac{1}{m}}s_w t_{1-\alpha/2}(m+n-2)]\) 4.当方差之间没什么信息,但样本量很大的时候 \([\bar{x}-\bar{y}±u_{1-\alpha/2}\sqrt{\frac{s_x^2}{m}+\frac{s_y^2}{n}}]\) 5.方差之间没什么信息,样本量也不是很大 \([\bar{x}-\bar{y}±s_0t_{1-\alpha/2}(l)]\) 其中 \(s_0^2=s_x^2/m+s_y^2/n \\ l=\frac{s_0^4}{\frac{s_x^4}{m^2(m-1)}+\frac{s_y^4}{n^2(n-1)}}\) $\sigma_1^2/\sigma_2^2$ 的置信区间: \([\frac{s_x^2}{s_y^2}\cdot\frac{1}{F_{1-\alpha/2}(m-1,n-1)},\frac{s_x^2}{s_y^2}\cdot\frac{1}{F_{\alpha/2}(m-1,n-1)}]\)
求近似置信区间
- 从样本均值服从渐进正态分布出发,对样本均值进行变形,从而服从标准正态分布
- 进而绑定$u_{1-\alpha/2}$
- 展开得到关于参数的二次方程
- 求解不等式得到置信区间